Google DeepMind представляет Evo-Memory для LLM
DeepMind предлагает Evo-Memory для оптимизации стратегий через повторное использование опыта.
Найдено записей: 59
DeepMind предлагает Evo-Memory для оптимизации стратегий через повторное использование опыта.
'Profit Parrot представил AI-инструменты для SEO, которые анализируют намерения поиска, генерируют оптимизированный контент и корректируют стратегию в реальном времени.'
Пошаговое руководство по запуску PySpark в Colab: от подготовки данных и SQL-аналитики до обучения модели и сохранения в Parquet.
'Практический туториал по Ivy: как писать модели один раз и запускать их на NumPy, PyTorch, TensorFlow и JAX, включая примеры транспиляции, контейнеров и замеров производительности.'
'Руководство по построению сквозного ML‑workflow на примере датасета диабета с оценкой, интерпретацией и сотрудничеством с Gemini в EDA и рисках.'
'Лидеры индустрии полагают, что системы с признаками AGI могут появиться в ближайшие годы, однако сроки и последствия остаются неопределёнными.'
NVIDIA XGBoost 3.0 теперь поддерживает обучение моделей GBDT на терабайтных данных с использованием одного суперчипа Grace Hopper, обеспечивая высокую скорость и экономию для предприятий.
Anthropic AI разработала метод векторных персон для выявления и контроля изменений личности в больших языковых моделях, что улучшает их надежность и безопасность.
Trackio — бесплатная и открытая библиотека Python, которая упрощает отслеживание экспериментов в машинном обучении благодаря локальному хранению, интеграции с Hugging Face и удобному онлайн-дашборду.
Anaconda привлекла инвестиции с оценкой в $1,5 млрд, делая акцент на безопасных и локальных решениях ИИ за пределами традиционных облачных платформ.
AlphaEarth Foundations от Google DeepMind — инновационный ИИ «виртуальный спутник», объединяющий множество данных наблюдения Земли в высокоточные, актуальные карты, решая проблему нехватки данных.
MiroMind-M1 представляет открытую платформу для продвинутого математического анализа, используя инновационное многоэтапное обучение с подкреплением для достижения передовых результатов и полной прозрачности.
Энергоориентированные трансформеры позволяют машинам выполнять сложное несупервизированное мышление системы 2, улучшая рассуждения и обобщение в различных задачах без специализированного надзора.
Физически основанный ИИ становится мощным подходом, внедряющим законы физики в модели машинного обучения для повышения эффективности, надежности и доверия в критически важных приложениях.
SynPref-40M представляет огромный набор данных предпочтений, который позволил создать серию моделей Skywork-Reward-V2 с передовыми результатами в согласовании человека и ИИ по нескольким бенчмаркам.
Thought Anchors — новый фреймворк, который улучшает понимание процессов рассуждений в больших языковых моделях за счет анализа вклада предложений и причинного влияния.
MDM-Prime улучшает Masked Diffusion Models, позволяя частично размаскировать токены, что повышает эффективность и качество генерации текста и изображений.
Исследователи Университета Мичигана представили G-ACT — инновационный фреймворк для управления языковыми предпочтениями в больших языковых моделях, повышающий надежность генерации научного кода.
Узнайте, как создать кастомный AI-инструмент для анализа данных с машинным обучением и статистикой на базе LangChain для расширения возможностей AI-агентов.
GURU представляет многоцелевой набор данных и модели обучения с подкреплением, значительно повышающие способности больших языковых моделей к рассуждению в шести различных областях и превосходящие предыдущие открытые модели.
ByteDance представила VGR — мультимодальную модель, которая динамически интегрирует визуальную информацию в процесс рассуждения, значительно улучшая точность и эффективность на бенчмарках зрения и языка.
Исследователи Texas A&M представили ShockCast — двухфазный метод машинного обучения с адаптивным выбором шага времени для точного моделирования сверхзвуковых течений.
Новое исследование показывает, что обобщение в моделях flow matching возникает из-за ограничений в аппроксимации поля скорости на ранних траекториях, опровергая роль стохастичности.
Узнайте, как голоса искусственного интеллекта эволюционировали от роботизированных до естественных, меняя индустрии доступности, развлечений и поддержки клиентов.
Чатботы AI Girlfriend становятся инновационным инструментом для изучающих языки, предлагая интерактивную и персонализированную практику разговорной речи для повышения беглости и коммуникативных навыков.
Исследователи представили метод с использованием латентных векторных полей для анализа баланса запоминания и обобщения в нейросетевых автокодировщиках без изменения моделей.
Исследователи EPFL разработали MEMOIR — инновационную систему для непрерывного, надежного и локального обновления больших языковых моделей, которая превосходит существующие методы.
StepFun представила Step-Audio-AQAA — полностью интегрированную аудио-языковую модель, которая обеспечивает естественное и выразительное голосовое взаимодействие, преобразуя устные запросы напрямую в устные ответы без текста.
OpenThoughts представляет масштабируемый пайплайн для создания данных SFT, значительно повышающий качество моделей рассуждений и достигающий передовых результатов в математике, программировании и науке.
Чатботы AI-девушки становятся инновационным решением для борьбы с одиночеством, обеспечивая эмоциональную поддержку и виртуальную компанию благодаря передовым технологиям искусственного интеллекта.
Оценка неопределённости становится ключевым инструментом для формирования доверия к ИИ, раскрывая степень уверенности в прогнозах. Новые вычислительные технологии ускоряют и упрощают внедрение этой практики.
С развитием ИИ растет важность масштабируемых и надежных решений для хранения данных, таких как ленточные технологии, которые обеспечивают инновации и конкурентные преимущества.
AI-чатботы виртуальных подруг используют передовые технологии и эмоциональную науку, чтобы создавать реалистичных и поддерживающих виртуальных компаньонов, меняя представление о человеческих отношениях.
Узнайте о лучших книгах по искусственному интеллекту для 2025 года, охватывающих основы, продвинутые техники, этические вопросы и перспективы развития ИИ.
LifelongAgentBench представляет новый бенчмарк для оценки непрерывного обучения агентов на базе LLM, фокусируясь на сохранении и адаптации знаний в последовательных задачах.
Йоми Теджумола, основатель Algomarketing, рассказывает, как ИИ и автоматизация освобождают маркетологов от рутинных задач и помогают развивать стратегический рост.
Aibidia привлекла $28 миллионов инвестиций для масштабирования своей AI-платформы в США, помогая многонациональным компаниям упрощать процессы трансфертного ценообразования и налогового комплаенса.
LLaDA-V представляет новый чисто диффузионный подход к мультимодальному языковому моделированию, достигая впечатляющих результатов в визуальном обучении и рассуждениях по разным задачам.
Модели Qwen2.5-Math значительно улучшают математическое мышление даже при обучении с неправильными или случайными наградами, что выявляет уникальные особенности усиленного обучения.
Исследователи из UT Austin представили Panda — предобученную модель, обученную на 20 000 хаотических систем, которая успешно прогнозирует сложные нелинейные динамические процессы, включая реальные и уравнения в частных производных.
Руководство по использованию библиотеки Synthetic Data Vault (SDV) для создания реалистичных синтетических табличных данных с описанием установки, подготовки метаданных, генерации и оценки качества.
PARSCALE предлагает новый подход к масштабированию языковых моделей через параллельные вычисления, снижая использование памяти и задержки при улучшении производительности.
Новое исследование показывает, как интеграция in-context learning в данные для дообучения значительно улучшает обобщение языковых моделей на сложных задачах рассуждения.
Meta выпустила KernelLLM — 8-миллиардную модель, которая автоматизирует преобразование PyTorch модулей в эффективные Triton GPU ядра, превосходя более крупные модели в бенчмарках.
Salesforce AI представила SWERank — новый фреймворк retrieve-and-rerank, обеспечивающий точную и масштабируемую локализацию проблем в ПО с заметным снижением затрат по сравнению с агентными методами.
Исследователи представили Effective State-Size (ESS) — новую метрику для измерения реального использования памяти в последовательных моделях, что улучшает оценку и оптимизацию их работы.
В этом руководстве показано, как построить конвейер активного обучения для классификации медицинских симптомов, интегрируя Adala с Google Gemini для эффективной аннотации и визуализации уверенности.
'ServiceNow представила Apriel-Nemotron-15b-Thinker — компактную AI-модель с высокой производительностью и вдвое меньшим потреблением памяти и токенов по сравнению с крупными моделями, оптимизированную для корпоративного внедрения.'
Срирам Нагасвами рассказывает о платформе Intelligent Control Tower от FourKites и о том, как ИИ меняет управление цепочками поставок через автоматизацию и интеграцию данных в реальном времени.
ИИ меняет бизнес-аналитику, автоматизируя подготовку данных, улучшая персонализацию и предоставляя предиктивные инсайты для повышения эффективности и роста.
Agentic Document Extraction меняет подход к автоматизации документов, преодолевая ограничения OCR с помощью ИИ и повышая точность и эффективность в различных отраслях.
ИИ трансформирует персонализацию видео, улучшая рекомендации, интерактивность и учитывая культурные особенности, при этом поднимая важные этические вопросы.
ByteDance анонсировала QuaDMix — систему, которая улучшает предобучение больших языковых моделей за счёт совместной оптимизации качества и разнообразия данных, обеспечивая значительный прирост производительности.
Модель DolphinGemma от Google с ИИ революционизирует изучение коммуникации дельфинов, анализируя сложные звуковые паттерны и позволяя взаимодействовать в реальном времени, с планами открыть модель в 2025 году.
Аршам Гахрамани, CEO Ribbon, рассказывает о том, как их платформа с ИИ ускоряет и делает процесс найма более справедливым и доступным благодаря инновационным голосовым технологиям и машинному обучению.
Новое исследование выявило, как ошибки в аннотациях AI-датасетов искажают оценку визуально-языковых моделей, подчеркивая необходимость улучшения практик человеческой разметки для повышения надежности моделей и снижения галлюцинаций.
Разделённые Диффузионные Трансформеры (DDT) разделяют семантическое кодирование и декодирование деталей, ускоряя обучение и улучшая качество генерации изображений, устанавливая новые рекорды на ImageNet.
Хедж-фонды меняют стратегии с помощью ИИ, используя продвинутый анализ данных, алгоритмическую торговлю и управление рисками для опережения конкурентов и развития устойчивого инвестирования.
Генеральный директор Tastewise Алон Чен рассказывает, как ИИ меняет инновации в пищевой индустрии, освещая новые тренды и перспективы использования ИИ.